1
スループット志向型計算への移行
AI021Lesson 1
00:00

計算は根本的な変化を経験しており、 レイテンシ最適化された CPUの設計から スループット志向型の GPUアーキテクチャへと移行しています。CPUは一つの荷物に速く届ける高速配送バイクに例えられる一方、GPUは単体では遅いですが、一度に5万個のコンテナを運ぶ巨大な貨物船です。

1. レイテンシとスループット

CPUは高度な分岐予測技術を用いて、一連の命令の「完了までの時間」を最小限に抑えるように設計されています。逆に、 グラフィックス処理ユニット(GPU) 数千のスレッドを並列で実行することで「1秒あたりの作業量」を最大化するように設計されており、単一スレッドの速度を犠牲にして総合的なスループットを高めています。

CPU(レイテンシ最適化)制御大容量キャッシュ(L3)ALU(算術論理演算装置)GPU(スループット最適化)多数の小さなALU

2. トランジスタの割当

GPUは、同程度の価格と電力消費環境下で、CPUよりもはるかに高い命令スループットとメモリ帯域幅を提供します。GPUは高度に並列な計算に特化しており、より多くのトランジスタを データ処理ユニット(ALU)に割り当てます。一方、CPUはデータキャッシュやフロー制御に多くのトランジスタを割り当てます。

3. CUDAの進化

コンピューティング統合デバイスアーキテクチャ(CUDA) は2006年にNVIDIAが導入しました。これは、グラフィックスAPIに依存せずにGPUの力を活用し、パフォーマンスを劇的に向上させるための並列計算プラットフォームおよびプログラミングモデルです。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>